这一节我们将看见,如何将数值函数用矩阵表示,并使用正定矩阵来指示函数的极值。
二次型
定义:对维实向量及阶实对称矩阵,称以下数值函数为一个实二次型(quadratic form),为一个二次齐次多项式。
对维复向量以及阶复矩阵且,则称为复二次型。
若阶矩阵为对角阵,则称二次型为对角型的:
任何二次型总可以经过坐标变换变为对角型的,这是因为对实对称矩阵,总存在正交阵,使得。
二次型的分类
一个二次型是:
- 正定的,若对所有,有;
- 负定的,若对所有,有;
- 不定的,若既有正值,也有负值;
- 半正定的,若对所有,有;
- 半负定的,若对所有,有;
性质及定理
主轴定理:
设是一个阶实对称矩阵,则存在正交变换,使得二次型变为对角型的二次型:
推论:
- 若为阶正定矩阵,则 表示中心在原点,主轴沿着的特征值方向,半长轴相应为的椭球面,其中为的特征值。
设为阶实对称矩阵,则二次型是:
- 正定的 <=> 的所有特征值都是正数;
- 负定的 <=> 的所有特征值都是负数;
- 不定的 <=> 的特征值既有负数,也有正数;
矩阵的合同
若两个矩阵,若存在阶可逆矩阵,使得:
则称矩阵和合同(congruent)
主轴定理可表述为:任何实对称矩阵正交合同与对角阵。
事实上,实对称矩阵不限于正交合同,其他代换(如LDU分解)也可合同与对角阵。
惯性定理:
- 实对称矩阵与矩阵具有相同数目的正特征值,负特征值和零特征值。
在函数极值中的应用
这里不给出证明,当我们使用一阶导为0求得稳定点之后,将函数转化为二次型,可根据二次型的性质判断是极小值还是极大值。
二次型矩阵(Hessian矩阵):
若二次型负定,则在达到极大值。
若二次型正定,则在达到极小值。
若二次型不定,则在不是极值。